FILTER MODE ACTIVE

#обучение LLM

Найдено записей: 11

#обучение LLM29.10.2025

Agent Lightning: обучите любого AI-агента с помощью RL на основе реальных трассировок

'Microsoft выпустила Agent Lightning, который конвертирует трассы выполнения агентов в переходы для RL обучения LLM с минимальными изменениями в стеке.'

ЧИТАТЬ →

#обучение LLM14.10.2025

Karpathy выпустил nanochat: обучите ChatGPT-подобную модель за ~4 часа и ~$100

'Andrej Karpathy опубликовал nanochat — минимальный end-to-end стек для обучения и развёртывания ChatGPT-подобных моделей, который можно прогнать за ~4 часа на одном 8×H100 за ~100 долларов.'

ЧИТАТЬ →

#обучение LLM20.08.2025

ZenFlow ускоряет до 5×: безстолковые offload-обновления для обучения LLM

'ZenFlow устраняет CPU-вызываемые простои GPU и ускоряет дообучение LLM до 5×, требуя только минимальных изменений в конфигурации DeepSpeed.'

ЧИТАТЬ →

#обучение LLM06.08.2025

Как ИИ учится улучшать себя: пять ключевых стратегий

ИИ развивается благодаря самоусовершенствованию через улучшение кодирования, оптимизацию инфраструктуры и автономные исследования, ускоряя путь к суперразуму.

ЧИТАТЬ →

#обучение LLM23.06.2025

Reinforcement-Learned Teachers от Sakana AI: Революция в эффективном обучении рассуждению LLM

Sakana AI представляет Reinforcement-Learned Teachers (RLTs) — новый подход, который обучает небольшие модели эффективно преподавать рассуждение большим языковым моделям через RL, ориентированное на создание пошаговых объяснений.

ЧИТАТЬ →

#обучение LLM18.06.2025

AREAL: Революция в обучении больших моделей рассуждений с полностью асинхронным усиленным обучением

AREAL — новая асинхронная система усиленного обучения, которая значительно ускоряет обучение больших моделей рассуждений, разделяя процессы генерации и обучения и достигая до 2.77× быстрейшего обучения без потери точности.

ЧИТАТЬ →

#обучение LLM10.06.2025

Meta представляет LlamaRL: масштабируемый фреймворк RL на PyTorch для эффективного обучения больших языковых моделей

Meta представила LlamaRL — инновационный масштабируемый асинхронный RL-фреймворк на PyTorch, который значительно ускоряет обучение больших языковых моделей при оптимальном использовании ресурсов.

ЧИТАТЬ →

#обучение LLM03.06.2025

Лаборатория Shanghai AI Предлагает Энтропийные Законы Масштабирования для Решения Проблемы Коллапса Исследования в RL для LLM

Исследователи из Shanghai AI Laboratory предложили энтропийные законы масштабирования и новые методы для преодоления коллапса исследования в обучении с подкреплением больших языковых моделей, достигнув заметного улучшения результатов.

ЧИТАТЬ →

#обучение LLM20.05.2025

Эффективное дообучение Qwen3-14B на Google Colab с Unsloth AI и оптимизацией LoRA

В этом руководстве показано, как эффективно дообучить модель Qwen3-14B на Google Colab с помощью Unsloth AI, используя 4-битную квантзацию и LoRA для экономии памяти при обучении на смешанных наборах данных.

ЧИТАТЬ →

#обучение LLM15.05.2025

Ultra-FineWeb: Триллионный датасет, улучшающий точность LLM на нескольких языках

Университет Цинхуа и ModelBest представили Ultra-FineWeb — триллионный многоязычный датасет, значительно повышающий точность крупных языковых моделей благодаря инновационной фильтрации данных.

ЧИТАТЬ →

#обучение LLM09.05.2025

«Абсолютный ноль» от Университета Цинхуа: обучение ИИ без внешних данных

Исследователи Университета Цинхуа создали парадигму Absolute Zero для обучения больших языковых моделей без внешних данных с помощью системы самосовершенствования на основе кодового исполнителя.

ЧИТАТЬ →